29/08, 2024

Bienvenida

OBJETIVOS

Cambio de nombre: Introducción al análisis (y manipulación) de datos geoespaciales

  1. Conocer y entender el concepto de Investigación Reproducible como una forma y filosofía de trabajo que permite que las investigaciones sean más ordenadas y replicables, desde la toma de datos hasta la escritura de resultados utilizando R.

  2. Ser capaz de realizar análisis críticos de la naturaleza de los datos al realizar análisis exploratorios y reforzar conociminetos en estadística.

  3. Realizar análisis de datos espaciales, poder visualizarlos y aplicar a preguntas de conservación y manejo de recursos naturales.

  4. Aprender a utilizar, de forma proficiente, el lenguaje de programación R y la plataforma GitHub en un ambiente de trabajo colaborativo.

Evaluaciones

Evaluación Ponderación
Ejercicios & Tareas \[\frac{1}{n}\sum_i^n nota\, tarea_i\] 50%
Proyecto código 1 15%
Proyecto código 2 10%
Proyecto código 3 15%
Participación / Asistencia 10%

Primeros pasos

  • Evaluación sencilla (Informes reproducibles + presentación reproducible)

  • Evaluación por pares

  • Mucho trabajo personal guiado

  • Pagina donde esta todo el curso

  • Hacer:

    1. suscribirse a servidor Discord

    2. hacerse usuario de GitHub

Elementos básicos

Objetos

Todo en R es un objeto

  • Identidad – Nombre
    • e.g. Teléfono, RORACO (Roble, Raulí, Coihue), BCS, ‘uso’, etc…
  • Estado – Característica
    • e.g. verde, = ‘3’, etc…
  • Comportamiento – Método
    • e.g. riiing, uso\[^2\] gith

Variables

Tipos de datos básicos en R:

Los tipos de datos básicos (o “primitivos”) más importantes son los tipos “numérico” (para números) y “carácter” (para texto). Otros tipos son el “entero”, que puede utilizarse para representar números enteros; el “lógico” para VERDADERO/FALSO, y el “factor” para variables categóricas.

Variables

  • numeric - (10.5, 55, 787)

  • integer - (1L, 55L, 100L, letra “L” lo declara como un entero)

  • complex - (9 + 3i, donde “i” es la parte imaginaria)

  • character (string) - (“k”, “R is exciting”, “FALSE”, “11.5”)

  • logical (boolean) - (TRUE or FALSE)

  • missing values - NA (Not Available / No disponible)

  • factor - Una categoría / nivel, ordenada, o no (i.e. )

    Un factor es una variable nominal (categórica) con un conjunto de valores posibles conocidos denominados niveles. Pueden crearse utilizando la función as.factor. En R suele ser necesario convertir (cast) una variable de carácter en un factor para identificar grupos para su uso en pruebas y modelos estadísticos.

Ejercicios

Computo simple

  1. Calcula la suma de 100.1, 234.9 and 12.01
  2. La raíz cuadrada de 256
  3. El logaritmo (base 10) de 100, y multiplique el resultado por el coseno de n. Ayuda: vea ?log and ?pi.
  4. Suma acumulada de 2, 3, 4, 5, 6.
  5. Suma acumulada anterior, pero en orden inverso.
  6. Encuentre 10 números enteros aleatorios entre 0 y 100 Ayuda: ?sample, ?runif, o una combinacion de aquello

Como se organizan los datos en R

Estructura de datos

  • Vector: Un conjunto lineal de datos (secuencia génica, serie de tiempo)
  • Matrix: Una tabla con solo números
  • Data Frame: Una tabla donde cada columna tiene un tipo de datos (estándar dorado)
  • List: Aqui podemos meter lo que queramos

Vector

  • Secuencia lineal de datos
  • Pueden ser de muchos tipos (numéricos, de carácteres, lógicos, etc.)
  • Ejemplo data(uspop)
  • para crear uno c(1,4,6,7,8)
  • para subsetear un vector se pone el índice entre []
  • uspop[4], uspop[2:10], uspop[c(3,5,8)]

Errores + comunes

Las siguientes líneas de código contienen algunos errores comunes que impiden que se evalúen correctamente o dan lugar a mensajes de error. 1. Mire el código sin ejecutarlo y vea si puede identificar los errores y corregirlos todos. 2. Luego, ejecute también el código defectuoso copiando y pegando el texto en la consola (no escribiéndolo, R studio intentará evitar estos errores por defecto) (¡pero no todos producen errores!).

vector1 <- c('one', 'two', 'three', 'four, 'five', 'seven')
vec.var <- var(c(1, 3, 5, 3, 5, 1)
vec.mean <- mean(c(1, 3, 5, 3, 5, 1))
vec.Min <- Min(c(1, 3, 5, 3, 5, 1))
Vector2 <- c('a', 'b', 'f', 'g')
vector2
vector1 <- c('one', 'two', 'three

Data Frame

  • Una tabla, cada columna un tipo de datos (Numérico, lógico, etc)
  • Cada columna un vector
  • Ejemplo data(iris)
  • Para subsetear data.frame[filas,columnas]
  • Ejemplos iris[,3], iris[“Petal.Length”], iris[2:5,c(1,5)], iris$Petal.Length

Ejercicio

Crea este data.frame en la variable z:
Numero Letra Medida
5 S 49.59
4 L 91.84
3 B 49.32
1 Q 72.25
2 A 65.51